NVIDIA官方發佈,命名為GTX680。
根據發佈內容,GK104將擁有1536 CUDA核心。圖片顯示出計算性能表現非常搶眼,領先HD 7970多達17%。
NVIDIA信心十足的產品誕生 NVIDIA日前在Facebook豪言:“等待Kepler中,請耐心,耐心,當時機成熟,它將不可戰勝”。儘管不到正式發佈,一切爆料都是浮雲。但NVIDIA的信心滿滿與VR-Zone曝光的內容相結合,是否暗示著新的Kepler架構,其性能表現將再次加強通用計算能力帶來的遊戲性能提升,而且進一步削弱了對傳統參數項目的依賴?下面讓我們走進NVIDIA通用計算的世界。
CUDA的過去與成長 首先,什麼是CUDA,CUDA即Compute Unified Device Architecture,直譯:統一計算架構,這是由NVIDIA所推出的一種集成技術,是對GPGPU的正式名稱,它包含了CUDA指令集架構(ISA)以及GPU內部的平行計算引擎。通過這項技術,使用者可以利用NVIDIA的GeForce8以後的GPU和較新的Quadro GPU進行計算,它率先利用GPU作為C-編譯器的開發環境。CUDA架構可以相容OpenCL或者NVIDIA自家的C-編譯器,而無論是哪種代碼,最終都會被驅動程式轉換成PTX代碼,交由NVIDIA核心計算。
CUDA——為GPU運算而生 正如前文所述,CUDA出現最早的是2006年推出的採用G80核心的GeForce8系列。當時是作為率先支持DirectX 10.0的GPU發佈的。
DirectX10.0成為CUDA開始展示魅力的舞臺 DirectX 10最大的革新就是統一渲染架構(Unified Shader Architecture)。這個架構標準的制定提升了GPU的可編程性能。NVIDIA借機提出了經過多年籌畫的CUDA通用計算架構。CUDA架構是第一個面向GPU的軟硬體結合通用處理解決方案,它的指令集架構能夠讓開發人員繞開傳統的圖形API而直接訪問GPU硬體,還包含了一個全新的C語言編譯器,開發人員可以用常見的C語言來為GPU編寫程式,編程效率成倍提高。
2010年,借通用計算之勢,微軟發佈了革命性的Windows 7 2010年10月23日,Windows 7帶著DirectX 11來到了大家面前,並成為繼Windows 95和Windows XP後,最受歡迎的Windows作業系統。在Windows7中,微軟附帶了一種名叫Direct Compute的API。簡單的說,所有符合Direct Compute規範的處理設備,不管是CPU還是GPU,在Windows 7作業系統中都被融合到了一起,作為統一的資料處理而用。GPU第一次以計算部件之一加入到了Windows之中。
與Windows7同年發佈的首款Fermi架構產品——GTX480 而當年3月27日發佈的新一代費米架構的顯卡GTX400系列也借此展示出強大的CUDA運算能力。
CUDA的現狀 NVIDIA CUDA架構不知不覺已經邁入第六個年頭。據外界估算,NVIDIA目前市值達到97億美元,接近競爭對手的兩倍。在硬體方面,CUDA成功延伸至GeForce娛樂領域,Quadro專業設計領域和Tesla高性能計算領域。
CUDA已延伸至NVIDIA多個子品牌並帶來革命 在GeForce娛樂領域,目前展現出CUDA優勢的莫過於2011年年度FPS大作《戰地3》,《戰地3》的歷史意義在於它是第一個完全只支持DirectX 11的遊戲。該遊戲採用的寒霜2引擎,大量的革命性的特性,極大的提升和影響了戰地3的圖形表現和遊戲體驗。其中就包含了Compute Shader和NVIDIA制定的新型FXAA抗鋸齒採樣技術。
《戰地3》堪稱是第一款拒絕Windows XP玩家的遊戲 在Compute Shader的支持下,PC版的戰地3擁有了遠比其他遊戲更加富裕的可用光源,這讓它有了極其真實的環境光照系統,進而擁有了遠比其他遊戲更加細膩的場景和細節刻畫能力。對於Compute Shader來說,執行單元的數量在大多數情況下並不是決定性的,真正關乎Compute Shader性能的要素,在於緩衝的數量、速度、操作方式以及整個構架的靈活度和並行度。而擁有充足緩衝以及完善的cache體系的NVIDIA Fermi構架在這方面做得非常好,CUDA的遊戲優勢得以盡展,輕鬆以中端產品GeForce GTX560Ti在1920X1200 Ultra 4AA/16AF的設置上,得到30幀/秒以上的良好遊戲體驗。
中端的GeFoece GTX560Ti即可流暢體驗戰地3的華麗特效 在專業領域,NVIDIA的Adobe自CS4時代以來一直保持著良好的合作關係,圖形設計與視頻剪輯、特效製作等常用的Photoshop、Premiere以及After Effects都能直接調用Quadro的CUDA來實現GPU加速。Premiere當中有一個非常有名的功能叫做水銀加速(Mercury GPU Acceleration),它可以調動GPU來實現很多需要即時渲染的內容,包含從預覽到輸出的多個環節,尤其是對於多軌視頻的應用有很強的提速作用。
Adobe Creative Suite 5.5 套件可以很好的利用NVIDIA的GPU進行加速 當然CUDA並不僅限於在Adobe系列套件中的應用,從視頻轉換軟體Badaboom和TMPGEnc到視頻優化軟體vReveal和TotalMedia,再到視頻編輯軟體PowerDirector7.0,CUDA的應用深入到了視頻領域的方方面面。 在高性能計算領域,曾經在2010年奪得全球超級電腦五百強排行榜第一位的中國“天河一號A”,就採用了7168塊NVIDIA Tesla M2050計算卡。
在2010年讓中國人引以為豪的“天河一號A” 得益于NVIDIA CUDA的超高並行度和集成度,天河一號A比排行第二的“美洲虎”節能2900多千瓦,節能幅度達42%,能耗比出眾。
Tesla加速科學計算 CUDA的未來——寄予厚望的Kepler 12年前,在那場著名對決中擊敗人類棋王卡斯帕羅夫的IBM 深藍超級電腦,它擁有11.38GigaFlops。而現在的NVIDIA 已經可以把幾百台數百公斤重的深藍超級電腦塞到一個不到500平方毫米的小晶片裏。
IBM深藍與NVIDIA顯示晶片——摩爾定律的最佳佐證 因此,從以上這些資料來看,至少在理論浮點運算能力這個指標上,單顆Fermi晶片的運算能力已經遠遠超過了當前的CPU,達到小型工作站的水準。而這些理論性能的發揮,還要取決於NVIDIA所提供的軟體平臺、下游應用廠商、程式開發者的共同支援。 一旦Fermi的性能得以施展,GPU通用計算所爆發出的能量必將在高性能計算領域引起一輪新的革命。
2011年,CUDA 5歲了 事實上,NVIDIA顯卡的歷史從1999年第一代NVIDIA GeForce256開始算,到現在只不過短短的13年。但可以看到,隨著GPU中的Shader計算能力的迅速提升,NVIDIA順勢推出了CUDA技術,為無論是普通家庭用戶,還是專業用戶,抑或是高性能需求用戶,都提供了適合應用需求的解決方案。 而即將面世的Kepler,至少從目前網曝的參數看來,NVIDIA依然堅持以通用計算為先,兼顧圖形應用的發展道路。既符合微軟DirectX的發展趨勢,滿足作為顯卡本身的性能需求,也能順應高性能的需求,作為電腦運算部件之一為滿足高性能運算要求貢獻力量。
新年交替之際,NVIDIA開放CUDA平臺並放出了CUDA 4.1通用計算開發包 而且,NVIDIA在去年12月,邁出了具有歷史意義的一部——發佈編譯器源代碼,開放CUDA平臺,此舉讓開發者能夠利用現有工具實現無縫調試與分析,而且讓 PGI 能夠專注於更高級別的優化與語言特性。
The Linux Foundation官網最新放出的新聞稿 而最新消息,NVIDIA還剛剛加入了Linux基金會,國外媒體評論認為,即將到來的Kepler GPU可能將對高性能電腦進一步帶來強有力的衝擊,因為以Linux為系統主導的超級計算領域擁有更廣泛和通用的生態環境,這有利於擴大NVIDIA在超級電腦中的影響力。
CUDA未來的目標:從超級手機到超級電腦 NVIDIA越來越開放的態度,為CUDA的未來發展鋪平了道路,只要未來的NVIDIA GPU能在通用計算能力上持續領先對手,CUDA的未來可以說是無可限量。
|